맨위로가기

한중일 통합 한자 확장 B

"오늘의AI위키"는 AI 기술로 일관성 있고 체계적인 최신 지식을 제공하는 혁신 플랫폼입니다.
"오늘의AI위키"의 AI를 통해 더욱 풍부하고 폭넓은 지식 경험을 누리세요.

1. 개요

한중일 통합 한자 확장 B는 유니코드 블록으로, 42,711개의 문자를 포함하며 U+20000부터 U+2A6D6까지의 코드 포인트를 갖는다. 1998년 IRG 회의에서 시작되어 여러 회의와 문서를 거쳐 유니코드 3.1 버전에 처음 추가되었다. 이 블록에는 글리프 변형, 중복 문자 및 준 중복 문자와 같은 문제점이 존재하며, JIS X 0213, 강희자전, HYD 데이터 등이 추가되었다. 이후 여러 차례에 걸쳐 한자의 추가, 수정 및 관련 논의가 이루어졌다.

더 읽어볼만한 페이지

  • 색인 모음 문서 - 검은 월요일
    검은 월요일은 대규모 인명 피해, 사회적 혼란, 경제적 위기 등 부정적인 사건을 지칭하는 명칭으로, 1209년 더블린 학살부터 2022년 스리랑카 시위대 공격과 경제적, 사회적 위기, 미국프로풋볼 감독 경질, 겨울방학 후 개학일 등 다양한 사건을 포함하며, 각 사건의 의미는 시대적 맥락을 고려해야 한다.
  • 색인 모음 문서 - 수소 이온
    수소 이온(H⁺)은 양성자와 같지만 수용액에서 물 분자와 결합하여 다양한 수화 이온을 형성하고, pH 농도 측정과 산-염기 반응, 전기 전도도, 생명체의 에너지 생산 등 다양한 현상과 관련이 있다.
  • 모든 색인 모음 문서 - 검은 월요일
    검은 월요일은 대규모 인명 피해, 사회적 혼란, 경제적 위기 등 부정적인 사건을 지칭하는 명칭으로, 1209년 더블린 학살부터 2022년 스리랑카 시위대 공격과 경제적, 사회적 위기, 미국프로풋볼 감독 경질, 겨울방학 후 개학일 등 다양한 사건을 포함하며, 각 사건의 의미는 시대적 맥락을 고려해야 한다.
  • 모든 색인 모음 문서 - 벤조퀴논
    벤조퀴논은 화학 색인 틀 사용법에 대한 문서이며, `{{화학 색인}}` 코드를 추가하여 화학 색인 기능을 사용하는 방법을 안내한다.
한중일 통합 한자 확장 B
설명
명칭CJK 통합 한자 확장 B
범위U+20000–U+2A6DF
유니코드 버전3.1
문자 수42711
추가 버전"13.0": 7
"14.0": 2
비고유니코드 문자 데이터베이스
유니코드 표준 버전 목록
유니코드 컨소시엄 제공 코드 차트 (UCS2003)
유니코드 표준 코어 명세 18.1장: 한자 관련 블록
표준화된 변형 시퀀스유니코드 문자 데이터베이스: 표준화된 변형 시퀀스 목록
표의 문자 변형 데이터베이스유니코드 컨소시엄 제공: 표의 문자 변형 데이터베이스
UTS #37, 유니코드 표의 문자 변형 데이터베이스
참고 자료유니코드 표준, 버전 14.0

2. 알려진 문제점

2. 1. 확장 B의 통일 불가능한 변형 및 정확한 중복

CJK 통합 한자 확장 B에도 수백 개의 글리프 변형이 인코딩되었다.[8] 의도적인 유사 글리프 변형 인코딩 외에도, 여섯 개의 정확한 중복 문자(동일한 문자가 실수로 두 번 인코딩된 경우)와 두 개의 준 중복 문자(CJK-B 문자가 해당 BMP 문자에 통합된 두 글리프 형태의 ''사실상'' 분리를 나타내는 경우)가 실수로 인코딩되었다:[9]

  • U+34A8 㒨 = U+20457 𠑗: U+20457은 U+34A8의 중국 소스 글리프와 동일하지만 U+34A8의 대만 소스 글리프와는 상당히 다르다.
  • U+3DB7 㶷 = U+2420E 𤈎: 동일한 글리프 모양
  • U+8641 虁 = U+27144 𧅄: U+27144는 U+8641의 한국 소스 글리프와 동일하지만 U+8641의 중국 본토, 대만 및 일본 소스 글리프와는 상당히 다르다.
  • U+204F2 𠓲 = U+23515 𣔕: 동일한 글리프 모양이지만 다른 부수 아래 정렬됨
  • U+249BC 𤦼 = U+249E9 𤧩: 동일한 글리프 모양
  • U+24BD2 𤯒 = U+2A415 𪐕: 동일한 글리프 모양이지만 다른 부수 아래 정렬됨
  • U+26842 𦡂 = U+26866 𦡦: 동일한 글리프 모양
  • U+FA23 﨣 = U+27EAF 𧺯: 동일한 글리프 모양 (U+FA23 﨣는 "CJK 호환 표의 문자-FA23"이라는 이름에도 불구하고 통합 CJK 표의 문자이다.)

3. 블록

이 목록은 단일 유니코드 블록이다. 유니코드의 모든 CJK 통합 한자 블록에 대한 개요는 CJK 통합 한자를 참조하라.

4. 역사

'''한중일 통합 한자 확장 B'''의 역사는 다음과 같다.

== 역사 ==

=== 유니코드 버전 3.1 ===

한중일 통합 한자 확장 B 블록은 42,711개의 문자를 포함하며, U+20000에서 U+2A6D6까지의 코드 포인트를 갖는다. 이 블록의 문자를 정의하는 과정은 1998년 5월 26일 넬슨 응과 마이클 쿵의 IRG 회의 #11 보고서에서 시작되었다.

이후 여러 차례의 회의와 문서를 통해 CJK 통합 표의 문자 확장 B에 대한 논의가 진행되었다. 여기에는 1999년 9월 3일 장 조재의 SuperCJK 버전 9.0 제안, 같은 날의 CJK 통합 표의 문자 확장 B WD 6.0, 그리고 1999년 11월 24일 미셸 수이냐르의 ISO/IEC 10646 파트 2의 CD 투표 텍스트 등이 포함된다.

2000년 1월 5일 V. S. 우마마헤스워란의 WG 2 회의 37 회의록에서는 CJK 통합 표의 문자 확장 B에 대한 논의가 10.3절에서 다루어졌다. 2001년에는 3월 28일 T. K. 사토의 오류 알림 및 수정 요청, 3월 30일 CJK 통합 표의 문자 확장 B PreIS For ISO/IEC 10646-2:2000, 4월 2일 장 조재의 CJK 통합 표의 문자 확장 B 버전 및 SuperCJK에 대한 설명 등의 문서가 발표되었다.

2002년 이후에도 조선민주주의인민공화국(북한)의 한자 추가 제안, 오류 수정, Unihan.txt 오류 보고, 글꼴 확인, 출처 참조 추가 제안 등 다양한 논의가 이루어졌다.

=== 이후 버전 ===

한중일 통합 한자 확장 B 블록은 2000년 11월에 제정된 유니코드 3.1 버전에 처음 추가되었다. 3.1 버전에서는 42,711개의 한자가 추가되었다.

이후 버전에서는 여러 차례에 걸쳐 한자가 추가되거나 수정되었다.

추가/수정 내용
JIS X 0213에서 314개의 한자가 추가되었다.
JIS X 0213에서 313개의 한자가 추가되었다.
SuperCJK 버전 9.0에는 강희자전 및 HYD 데이터가 포함되었다.
CJK 통합 한자 확장 B WD 6.0이 제안되었다.
JCS 제안에 대한 의견이 제시되었다.
현대 일본어에서 제안된 한자의 용법 및 출처가 발췌되었다.
ISO/IEC 10646 파트 2의 CD 투표 텍스트가 제안되었다.
비공감 규칙이 명확화되었다.
WG 2 회의 37에서 JIS X 0213 한자 문자를 확장 B에서 BMP로 이동하자는 제안이 논의되었다.
CJK 통합 한자 확장 B에서 특정 JIS X 0213 문자에 대한 매핑 정보에 대한 오류 알림 및 수정 요청이 있었다.
조선민주주의인민공화국(북한)의 한자 코드 추가 제안이 있었다.
오류 수정이 있었다.
유니코드 4.0.1 베타 검토에서 앤드류 C. 웨스트의 의견이 제시되었다.
kHKSCS, kCowles 항목 관련 Unihan 보고 오류 및 변경 사항이 있었다.
CJK_B 21E2D 및 21E45에 대한 중국의 글꼴이 확인되었다.
기존 CJK 통합 표의 문자에 6개의 KP 출처 참조를 추가하자는 제안이 있었다.
확장 B 글꼴 버전 관리에 대한 보고서가 제출되었다.
WG 2 회의 51에서 확장 B 글리프 관련 논의가 있었다.
기존 ISO/IEC 10646:2003에 대한 11개의 KP 출처 참조를 대체하자는 제안이 있었다.
한자 통합 문제가 논의되었다.
"Hanyo-Denshi" IVD 컬렉션(PRI 167) to Adobe-Japan1-6 매핑 테이블이 제안되었다.
WG 2 회의 57에서 CJK Ext. B 글리프 관련 논의가 있었다.
고아 CJK 표의 문자의 출처가 논의되었다.
CJK 차트 및 출처 참조 업데이트가 있었다.
WG 2 회의 63에서 관련 논의가 있었다.
열세 개의 표의 문자에 kIRG_GSource 값을 추가하고 일반 표준 중국어 문자 표에 대한 두 개의 G-출처 글리프를 변경하는 요청이 있었다.
화학 용어에 대한 TCA의 가로 확장 요청이 있었다.
14개의 CJK 표의 문자에 대한 중국의 가로 확장에 대한 제안이 있었다.
ISO/IEC 10646에 CJK 통합 표의 문자의 11개 G 글리프를 업데이트하는 제안이 있었다.
U+23517에 대한 G 글리프 수정이 있었다.
KS X 1027-5의 가로 확장에서 문자 K6-1022를 U+3EAC에서 U+248F2로 이동하라는 요청이 있었다.
WG 2 회의 67에서 관련 논의가 있었다.
기술적 사용 문자에 대한 중국의 가로 확장 제안이 있었다.


4. 1. 유니코드 버전 3.1

한중일 통합 한자 확장 B 블록은 42,711개의 문자를 포함하며, U+20000에서 U+2A6D6까지의 코드 포인트를 갖는다. 이 블록의 문자를 정의하는 과정은 1998년 5월 26일 넬슨 응과 마이클 쿵의 IRG 회의 #11 보고서에서 시작되었다.

이후 여러 차례의 회의와 문서를 통해 CJK 통합 표의 문자 확장 B에 대한 논의가 진행되었다. 여기에는 1999년 9월 3일 장 조재의 SuperCJK 버전 9.0 제안, 같은 날의 CJK 통합 표의 문자 확장 B WD 6.0, 그리고 1999년 11월 24일 미셸 수이냐르의 ISO/IEC 10646 파트 2의 CD 투표 텍스트 등이 포함된다.

2000년 1월 5일 V. S. 우마마헤스워란의 WG 2 회의 37 회의록에서는 CJK 통합 표의 문자 확장 B에 대한 논의가 10.3절에서 다루어졌다. 2001년에는 3월 28일 T. K. 사토의 오류 알림 및 수정 요청, 3월 30일 CJK 통합 표의 문자 확장 B PreIS For ISO/IEC 10646-2:2000, 4월 2일 장 조재의 CJK 통합 표의 문자 확장 B 버전 및 SuperCJK에 대한 설명 등의 문서가 발표되었다.

2002년 이후에도 조선민주주의인민공화국의 한자 추가 제안, 오류 수정, Unihan.txt 오류 보고, 글꼴 확인, 출처 참조 추가 제안 등 다양한 논의가 이루어졌다.

4. 2. 이후 버전

한중일 통합 한자 확장 B 블록은 2000년 11월에 제정된 유니코드 3.1 버전에 처음 추가되었다. 3.1 버전에서는 42,711개의 한자가 추가되었다.

이후 버전에서는 여러 차례에 걸쳐 한자가 추가되거나 수정되었다.

  • JIS X 0213에서 314개의 한자가 추가되었다.
  • JIS X 0213에서 313개의 한자가 추가되었다.
  • SuperCJK 버전 9.0에는 강희자전 및 HYD 데이터가 포함되었다.
  • CJK 통합 한자 확장 B WD 6.0이 제안되었다.
  • JCS 제안에 대한 의견이 제시되었다.
  • 현대 일본어에서 제안된 한자의 용법 및 출처가 발췌되었다.
  • ISO/IEC 10646 파트 2의 CD 투표 텍스트가 제안되었다.
  • 비공감 규칙이 명확화되었다.
  • WG 2 회의 37에서 JIS X 0213 한자 문자를 확장 B에서 BMP로 이동하자는 제안이 논의되었다.
  • CJK 통합 한자 확장 B에서 특정 JIS X 0213 문자에 대한 매핑 정보에 대한 오류 알림 및 수정 요청이 있었다.
  • 조선민주주의인민공화국의 한자 코드 추가 제안이 있었다.
  • 오류 수정이 있었다.
  • 유니코드 4.0.1 베타 검토에서 앤드류 C. 웨스트의 의견이 제시되었다.
  • kHKSCS, kCowles 항목 관련 Unihan 보고 오류 및 변경 사항이 있었다.
  • CJK_B 21E2D 및 21E45에 대한 중국의 글꼴이 확인되었다.
  • 기존 CJK 통합 표의 문자에 6개의 KP 출처 참조를 추가하자는 제안이 있었다.
  • 확장 B 글꼴 버전 관리에 대한 보고서가 제출되었다.
  • WG 2 회의 51에서 확장 B 글리프 관련 논의가 있었다.
  • 기존 ISO/IEC 10646:2003에 대한 11개의 KP 출처 참조를 대체하자는 제안이 있었다.
  • 한자 통합 문제가 논의되었다.
  • "Hanyo-Denshi" IVD 컬렉션(PRI 167) to Adobe-Japan1-6 매핑 테이블이 제안되었다.
  • WG 2 회의 57에서 CJK Ext. B 글리프 관련 논의가 있었다.
  • 고아 CJK 표의 문자의 출처가 논의되었다.
  • CJK 차트 및 출처 참조 업데이트가 있었다.
  • WG 2 회의 63에서 관련 논의가 있었다.
  • 열세 개의 표의 문자에 kIRG_GSource 값을 추가하고 일반 표준 중국어 문자 표에 대한 두 개의 G-출처 글리프를 변경하는 요청이 있었다.
  • 화학 용어에 대한 TCA의 가로 확장 요청이 있었다.
  • 14개의 CJK 표의 문자에 대한 중국의 가로 확장에 대한 제안이 있었다.
  • ISO/IEC 10646에 CJK 통합 표의 문자의 11개 G 글리프를 업데이트하는 제안이 있었다.
  • U+23517에 대한 G 글리프 수정이 있었다.
  • KS X 1027-5의 가로 확장에서 문자 K6-1022를 U+3EAC에서 U+248F2로 이동하라는 요청이 있었다.
  • WG 2 회의 67에서 관련 논의가 있었다.
  • 기술적 사용 문자에 대한 중국의 가로 확장 제안이 있었다.

참조

[1] 웹사이트 Unicode character database https://www.unicode.[...] 2023-07-26
[2] 웹사이트 Enumerated Versions of The Unicode Standard https://www.unicode.[...] 2023-07-26
[3] 간행물 18.1: Han (§ Blocks Containing Han Ideographs) https://www.unicode.[...] Unicode Consortium
[4] 웹사이트 Unicode Character Database: Standardized Variation Sequences https://www.unicode.[...] The Unicode Consortium
[5] 웹사이트 Ideographic Variation Database https://www.unicode.[...] Unicode Consortium
[6] 웹사이트 UTS #37, Unicode Ideographic Variation Database https://www.unicode.[...] Unicode Consortium
[7] 웹사이트 The Unicode Standard, Version 14.0 https://www.unicode.[...] Unicode Consortium
[8] 웹사이트 unifiable glyph variants http://www.cse.cuhk.[...] 2017-12-01
[9] 웹사이트 Defect Report on Duplicate Encoded CJK Forms http://std.dkuug.dk/[...] ISO/IEC JTC1/SC2/WG2 2003-10-06
[10] 웹인용 Unicode character database https://www.unicode.[...] 2016-07-09
[11] 웹인용 Enumerated Versions of The Unicode Standard https://www.unicode.[...] 2016-07-09



본 사이트는 AI가 위키백과와 뉴스 기사,정부 간행물,학술 논문등을 바탕으로 정보를 가공하여 제공하는 백과사전형 서비스입니다.
모든 문서는 AI에 의해 자동 생성되며, CC BY-SA 4.0 라이선스에 따라 이용할 수 있습니다.
하지만, 위키백과나 뉴스 기사 자체에 오류, 부정확한 정보, 또는 가짜 뉴스가 포함될 수 있으며, AI는 이러한 내용을 완벽하게 걸러내지 못할 수 있습니다.
따라서 제공되는 정보에 일부 오류나 편향이 있을 수 있으므로, 중요한 정보는 반드시 다른 출처를 통해 교차 검증하시기 바랍니다.

문의하기 : help@durumis.com